其他
大数据席卷而来,不仅引发了IT界的热潮,同样也引发了地理信息领域的热情,空间大数据的概念也随之而来,但目前业界对空间大数据缺乏统一的理解和认识,比如,一些报告和文章把海量空间数据也称为空间大数据,造成了一些误会和混淆。
到底什么是空间大数据?空间大数据是带有或隐含空间位置的,具有体量大、变化快、种类多、价值密度低特点的,用以前的常规软件工具无法处理,大数据技术处理后能带来更强决策力、洞察力和流程优化能力的数字资产。
也许这个定义依然不易理解,到底哪些数据是空间大数据呢?下图中列举的这些大数据,都属于空间大数据之列。
在本号文章《千万别随便称大数据,否则可能会贬低你的数据价值!》一文中讨论过,大数据具有低价值密度的特性,是贫矿,因此把已有的经典的海量空间数据贴上大数据的标签并不增值。对于经典的海量空间数据,即使基于Spark、Hadoop、MongoDB等大数据技术来管理、处理与分析,它们也不会变成大数据。
另外,从DIKW模型来看,大数据是出于该模型第一层级的数据,是原始素材,而经典的测绘4D产品是处于第二层级信息,是经过加工处理后有逻辑的数据。从这个意义上来说,海量的测绘4D产品若被贴上大数据的标签,也被降格了。
为了方便大家理解空间大数据的外延,本文仅举了部分例子,并不是全部,随着空间大数据应用的发展,大家还会发现更多的空间大数据。正确理解空间大数据的内涵和外延,有利于未来更加有效的推进空间大数据开发与利用,与IT行业共同享用大数据的盛宴。
往期回顾
(点击标题直接访问)